您现在的位置是:立马万言网 > 休闲
连夜研究,美股震荡,DeepSeek到底干了什么?
立马万言网2025-01-31 18:56:13【休闲】5人已围观
简介出品 | 网易科技态度栏目作者 | 袁 宁编辑 | 丁广胜DeepSeek给全世界人民,拜!年!了!当DeepSeek从登顶中美应用商店免费榜,蔓延到成为X、微博、小红书的热门话题,这场关于AI的
出品 | 网易科技态度栏目
作者 | 袁 宁
编辑 | 丁广胜
DeepSeek给全世界人民,拜!震荡年!到底了!连夜
当DeepSeek从登顶中美应用商店免费榜,蔓延到成为X、到底微博、连夜小红书的研究热门话题,这场关于AI的美股狂欢也逐渐从技术范畴,走到了国运叙事。震荡网友纷纷戏称“建议连夜安排DeepSeek上春晚”。到底
春晚可能是赶不上彩排了,但这个年无疑难忘今宵。
(黑神话悟空制作人冯骥表示DeepSeek为国运级别的科技成果)
事情从DeepSeek发布新模型起,经过中美再次对账,美国芯片封锁好像不仅没起到作用,反而激发了中国的创新?
一时间,各大主流媒体开始跟进,铺天盖地的报道下,持续看涨的英伟达股价大跌。
一众大佬开始现身评价:特朗普表示DeepSeek给美国人工智能产业敲响了警钟,ScaleAI创始人则暗戳戳表示中国人太努力,meta更是连夜成立四个专项小组研究其技术原理……
(《华尔街日报》:硅谷对中国制造的人工智能模型赞不绝口)
(《纽约时报》:DeepSeek是如何颠覆人工智能的)
(《时代杂志》:DeepSeek引发股市混乱)
DeepSeek是什么?为什么是它让硅谷科技大佬集体破防?它又凭什么造成了美股的震荡?你需要知道这些:
一、DeepSeek是什么?
简单来说,DeepSeek是一家中国的人工智能研究公司。旗下产品为DeepSeek,可以在PC端和移动端使用。
首先,区别于硅谷AI企业依赖明星科学家的模式,DeepSeek核心团队不到150人,没有“明星”,也没有“海归”,人才构成完全本土。
创始人梁文锋,80后,本硕均毕业于浙江大学。他曾透露,DeepSeek员工都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。此前,雷军以千万年薪招揽的95后“天才AI少女”罗福莉,就曾是DeepSeek的团队成员。
此外,背靠量化私募公司幻方量化,DeepSeek至今没有融资,完全靠自有资金运行。同时,它也是国内除大厂外,唯一拥有万张A100芯片的公司。
( 2019年,梁文锋在金牛奖颁奖仪式上,发表主题演讲《一名程序员眼里中国量化投资的未来》,当时幻方管理的资金规模就已破百亿。)
二、AI界的“拼多多”,让硅谷连夜查账
宣称能力可以对标GPT系列的模型并不少,为什么偏偏是DeepSeek让硅谷AI圈集体大破防?
核心在于其极致低价的模型成本。
据介绍,对标GPT-4o的模型DeepSeek-V3,仅使用了2000块英伟达芯片,训练成本不到558万美元,是同类模型的1/10。
要知道,OpenAI给特朗普画的”星际大饼“可是价值5000万美元。
Meta内部员工更是吐槽:“我们一个高管的年薪就够训练整个DeepSeek模型了,而这样的高管我们有几十个,公司怎么向股东交代?“
其实,早在这次产生爆炸影响力之前,DeepSeek就已经凭借其极致性价比,在去年5月出圈。获得“AI界拼多多”称号的同时,也带动国内大厂打起了大模型价格战。
但值得注意的是,区别于赔钱换流量的模式,DeepSeek在低价的同时仍然保持盈利。
梁文锋曾介绍:我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。
三、算力神话破灭?华尔街估值地震
而DeepSeek能够保持低成本的原因,则在于其架构创新。
其首创MLA(多头潜在注意力机制)与DeepSeekMoE架构,将显存占用降至传统模型的5%-13%,并通过强化学习实现“无监督推理突破”——模型可自主反思纠错,甚至展示数万字思维链。
换句话说,仅用很少的AI芯片,通过算力效率提高,模型也能实现同样的智能。打破AI产业对芯片依赖迷信的同时,也无疑给那些认为仅靠巨额资金就能遏制竞争的巨头们,当头一棒。
正因如此,DeepSeek-R1发布次日,英伟达、博通股价分别暴跌16.9%和17.4%,微软、谷歌跟跌,欧洲ASML、西门子能源跌幅超7%。
四、挑战OpenAI霸权,用开放击穿闭源护城河
此外,DeepSeek更是将代码、训练方法、论文全部公开,并在MIT协议下允许商业应用。
在”X“上我们已经可以看到伯克利、港科大等学生已用几十美元成功复现模型,被英伟达科学家称为“非美国公司践行OpenAI初心”。
(伯克利博士用DeepSeek复现模型能力)
要知道,OpenAI的API定价几乎为DeepSeek的30倍,而DeepSeek应用更是当前唯一支持免费联网与深度思考的模型。试问什么会比免费更香?
——DeepSeek的开源生态直接动摇了硅谷“闭源垄断——高额订阅”的盈利逻辑。正如深度学习之父杨立昆所言:“这不是中美之争,而是开源对闭源的超越”。
以上就是,DeepSeek此次引起巨大反响的原因。
One More Thing
更令人惊喜的是,更多人看到了DeepSeek具备的“本土灵魂”。借着年味,小红书上的用户已经开始尝试用DeepSeek写诗,写春联。
(Midjourney创始人使用DeepSeek之后的评价)
而DeepSeek能够带来的惊喜显然不止于此,就在今天除夕,DeepSeek再次推出新模型。
辞旧迎新,2025年的AI江湖,好戏刚刚开场。期待中国科技早日从“追赶叙事”走向“定义叙事”。
延伸阅读很赞哦!(1)
站长推荐
友情链接
- 一些备受推崇的美国高中
- uiuc金融硕士迎来新学年
- uiuc 设计艺术
- 大学本科两年制专业
- 专家建议大湾区 电影合作的城市分工
- 江苏南京雨花台区开展食盐科普宣传
- 广东:举办中央厨房与连锁餐饮服务单位食品安全管理培训班
- 去加拿大上高中带什么
- 广西玉林:局长进大厅 服务暖民心
- 广东:举办中央厨房与连锁餐饮服务单位食品安全管理培训班
- 美国商业与科技专业
- 今年纽约视觉学院研究生的人数
- uiuc 设计艺术
- 广西龙胜:开展“危险文具”专项执法检查
- 山东济南:规范学生文具类商品价格行为
- 宁夏石嘴山市场监管系统招才引智工作再创佳绩
- 如何办理加拿大留学签证
- 加州州立大学北岭分校US排名
- 内地春节80亿票房 创多项世界纪录
- 圣里奥大学usnews排名
- uiuc 设计艺术
- 去加拿大读高中一年总费用多少钱
- 今年纽约视觉学院研究生的人数
- 今年纽约视觉学院研究生的人数
- 浙江开展“百姓点检进校园”活动
- 江西:低风险市场主体“无事不扰”实现率超八成
- 马来亚大学项目管理专业
- 去加拿大读高中一年总费用多少钱
- 乔治城CCT表现如何
- 广西玉林:局长进大厅 服务暖民心
- 申请美国高中留学要准备哪些成绩
- 山东济南部署开展网络销售药品监管工作
- 内地春节80亿票房 创多项世界纪录
- Niw美国移民费用
- 可以同时递交i140和i485吗?
- Niw美国移民费用
- 专家建议大湾区 电影合作的城市分工
- 广西南宁:规范农资经营 护航春耕生产
- 加州大学戴维斯分校学费
- UC戴维斯维护治安